Stable Diffusion进阶篇:AnimateDiff 动画插件2
(请先看上一篇AnimateDiff的内容,本篇是进阶参数学习)
在上篇笔记中学习了一下什么是AnimateDiff(以下简称AD)以及其简单的操作流程,至少看完上篇笔记之后就可以简单制作出一个小动画了。虽然只是一个比较短的动画,但是至少理解了AD的运作原理,那就是一张张图片进行重绘然后再拼接起来形成一个动图。
不过上节课没有学到的是关于AD的其他参数:
首先最为基础也是最为核心的就是运动模型,也是上篇笔记中提到的运动模块。AD的开发者们针对Stable Diffusion1.5一共训练过三代模型,分别用V1、V2、V3来表示。
就目前来看V3的模型是最新也是训练得最先进的,其出图的运动会更加流畅自然,老版本的问题则在于生成图片的时候可能会出现水印,比较影响观感。
接下来会影响绘制效果的参数是上下文单批数量:
不过这个参数也不是越大越好,当上下文长度超过了一定的帧数时,可能会导致生成的图像背景过于单一而缺乏变化。
之所以会这样是因为AnimateDiff的运动模型是基于16帧的视频长度去训练的,因此这个上下文单批数量最好不要超过16帧。
当然显存也会影响到这一点,同时画多张图需要占用更高的显存,如果觉得电脑卡顿明显的话就把单批数量改为8,这样可以额外再节约1G左右的显存。
像是最上方的动图在生成了之后会有一个循环播放的感觉,这是因为有一个闭环模式Closed-loop存在。
- N:不循环
- R-P(Prompt Travel不强制闭环):减少循环上下文
- R+P(Prompt Travel强制闭环):减少循环上下文
- A:总是循环(动图第一帧与最后一帧一致)
在循环的时候右侧参数步幅和重叠都会对动画效果造成一定影响
在之前的操作都是关于动画的质量,而动画的时长则是与“帧数”和“帧率”相关:
视频总秒数=总帧数/帧率
如果帧率是8,想要做一个5秒的视频就把总帧数改为40就可以了。一般在网上看到的视频帧率大多数是23帧、30帧甚至60帧较为居多,不过这里也不建议直接提高帧率。过高的帧率设置不仅会加重显卡的绘制负担,还可能导致“闪烁”的概率增加。
不过扩展的作者给出了另一个巧妙的解决方案,就是利用一个叫做FILM(Frane Interpolation for Large Motion)的AI模型进行“插帧”
在开启了之后回到AnimateDiff中,只需要开启帧插值,右侧的插值次数X就相当于基于同样的帧数在每两帧之间插入“X”帧,从而让视频变慢X倍。
设置为3就相当于让视频放慢三倍,但是与此同时上面的帧率要X3也就是8x3=24,这样出来的动画会比原来更加流畅丝滑。
动图太大我压缩了也没法上传,大伙可以自己在家尝试一下。
今天的内容就到这里结束啦!
这篇文章主要是可以帮助生成的视频和动画更加流畅自然一些,大家也可以针对自己的喜好和设备情况进行参数的调节。
剩余的内容就下篇笔记见啦~拜了个拜。
Negative prompt: sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, bad anatomy,(long hair:1.4),DeepNegative,(fat:1.2),facing away, looking away,tilted head, lowres,bad anatomy,bad hands, text, error, missing fingers,extra digit, fewer digits, cropped, worstquality, low quality, normal quality,jpegartifacts,signature, watermark, username,blurry,bad feet,cropped,poorly drawn hands,poorly drawn face,mutation,deformed,worst quality,low quality,normal quality,jpeg artifacts,signature,watermark,extra fingers,fewer digits,extra limbs,extra arms,extra legs,malformed limbs,fused fingers,too many fingers,long neck,cross-eyed,mutated hands,polar lowres,bad body,bad proportions,gross proportions,text,error,missing fingers,missing arms,missing legs,extra digit, extra arms, extra leg, extra foot,holding, holding_camera
- Steps: 30
- Sampler: Euler a
- CFG scale: 7
- Seed: 3878725014
- Size: 512x512
- Model hash: e4a30e4607
- Model: majicmixRealistic_v6
- Denoising strength: 0.7
- Clip skip: 2
- ENSD: 31337
- Hires upscale: 2
- Hires upscaler: R-ESRGAN 4x+
- Lora hashes: “March7th: ed83eddc60bc”
- Pad conds: True
- Version: v1.7.0
部分参考素材来源:
原教材链接: